SamlibPublicationPageReader.java example

Explorer

SITracker-master
- SITracker
  - src
    - main
      - java
        com
        andrada
        sitracker
        Constants.java
        SITrackerApp.java
        analytics
        AddAuthorEvent.java
        AnalyticsManager.java
        ExportAuthorsEvent.java
        FBAEvent.java
        ImportAuthorsEvent.java
        ImportEvent.java
        MarkAsReadEvent.java
        PublicationOpenedEvent.java
        RatePublicationEvent.java
        RemoveAuthorEvent.java
        SearchAuthorEvent.java
        SelectAuthorEvent.java
        ViewAuthorEvent.java
        ViewCategoryEvent.java
        ViewNewPublications.java
        ViewPublicationEvent.java
        bitmap
        AvatarDrawable.java
        CheckableAvatarFlipDrawable.java
        FlipDrawable.java
        contracts
        AppUriContract.java
        AuthorItemListener.java
        AuthorUpdateStatusListener.java
        IsNewItemTappedListener.java
        OnBackAware.java
        SIPrefs.java
        SiteProvider.java
        db
        beans
        Author.java
        Publication.java
        SearchedAuthor.java
        dao
        AuthorDao.java
        AuthorDaoImpl.java
        PublicationDao.java
        PublicationDaoImpl.java
        manager
        SiDBHelper.java
        events
        AuthorAddedEvent.java
        AuthorCheckedEvent.java
        AuthorMarkedAsReadEvent.java
        AuthorSelectedEvent.java
        AuthorSortMethodChanged.java
        AuthorsExported.java
        BackUpRestoredEvent.java
        CancelImportEvent.java
        ImportUpdates.java
        ProgressBarToggleEvent.java
        PublicationMarkedAsReadEvent.java
        RatingResultEvent.java
        ShareEventResultMessage.java
        exceptions
        AddAuthorException.java
        RatingException.java
        SearchException.java
        SharePublicationException.java
        loader
        AsyncTaskResult.java
        OrmListLoader.java
        SamlibSearchLoader.java
        reader
        AuthorPageReader.java
        AuthorSearchReader.java
        CgiSamlib.java
        CgiSamlibAuthorPageReader.java
        PublicationPageReader.java
        Samlib.java
        SamlibAuthorPageReader.java
        SamlibAuthorSearchReader.java
        SamlibCgiSearchStrategyImpl.java
        SamlibPublicationPageReader.java
        SamlibSeekSearchStrategyImpl.java
        SearchStrategy.java
        SiteDetector.java
        SiteStrategy.java
        tasks
        AddAuthorTask.java
        ClearPublicationCacheTask.java
        ExportAuthorsTask.java
        ImportAuthorsTask.java
        UpdateAuthorsTask.java
        filters
        BaseIntentMessageFilter.java
        UpdateStatusMessageFilter.java
        io
        AuthorFileImportContext.java
        AuthorImportStrategy.java
        PlainTextAuthorImport.java
        SIInformerXMLAuthorImport.java
        messages
        AuthorsUpToDateIntentMessage.java
        BaseIntentMessage.java
        UpdateFailedIntentMessage.java
        UpdateSuccessfulIntentMessage.java
        receivers
        BootReceiver.java
        UpdateStatusNotificationReceiver.java
        UpdateStatusReceiver.java
        ui
        AuthorDetailsActivity.java
        BaseActivity.java
        DirectoryChooserController.java
        ExportAuthorsController.java
        ImportAuthorsActivity.java
        PublicationDetailsActivity.java
        SearchActivity.java
        SettingsActivity.java
        SiMainActivity.java
        SimpleSinglePaneActivity.java
        components
        AboutDialogView.java
        AuthorItemView.java
        CollectionViewCallbacks.java
        FileFolderView.java
        ImportProgressView.java
        NewPubItemView.java
        PublicationCategoryItemView.java
        PublicationItemView.java
        SearchAuthorItemView.java
        debug
        DebugAction.java
        DebugActionRunnerActivity.java
        DebugActionRunnerFragment.java
        actions
        ShowAuthorsUpdatedNotificationALotAction.java
        ShowAuthorsUpdatedNotificationFewAction.java
        fragment
        AboutDialog.java
        AuthorsFragment.java
        BaseFragment.java
        BaseListFragment.java
        DirectoryChooserFragment.java
        NewPublicationsFragment.java
        PublicationInfoFragment.java
        PublicationsFragment.java
        RatePublicationDialog.java
        RemoteAuthorsFragment.java
        adapters
        AuthorsAdapter.java
        NewPubsAdapter.java
        PublicationsAdapter.java
        PublicationsPageAdapter.java
        SearchResultsAdapter.java
        SmartFragmentStatePagerAdapter.java
        widget
        AutoResizeTextView.java
        BezelImageView.java
        CheckedRelativeLayout.java
        ColoredSpinnerBar.java
        DividerItemDecoration.java
        EllipsizedTextView.java
        GridSpacingItemDecoration.java
        MessageCardView.java
        MultiSwipeRefreshLayout.java
        TouchDelegateGroup.java
        TouchDelegateRelativeLayout.java
        util
        ActivityFragmentNavigator.java
        ClipboardHelper.java
        DateFormatterUtil.java
        LogUtils.java
        NavDrawerManager.java
        NetUtils.java
        PlayServicesUtils.java
        RatingUtil.java
        SamlibPageHelper.java
        ShareHelper.java
        SiBackupAgent.java
        UIUtils.java
        UpdateServiceHelper.java
        permission
        Permissions.java
        RuntimePermissionsInteraction.java
        RuntimePermissionsUtils.java

/*
 * Copyright 2014 Gleb Godonoga.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package com.andrada.sitracker.reader;

import android.text.TextUtils;
import android.util.Pair;

import org.jetbrains.annotations.NotNull;

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class SamlibPublicationPageReader implements PublicationPageReader {

    public static final String SAMLIB_URL_PREFIX = "http://samlib.ru/";

    private static final String IMAGE_EXTRACTION_REGEX = "<table .*?<img src=(.*?)\\s.*?<br>\\s*(.*?)<br>";

    @NotNull
    @Override
    public List<Pair<String, String>> readPublicationImageUrlsAndDescriptions(String pageContent) {
        List<Pair<String, String>> result = new ArrayList<Pair<String, String>>();

        Pattern pattern = Pattern.compile(IMAGE_EXTRACTION_REGEX, Pattern.CASE_INSENSITIVE | Pattern.DOTALL);
        Matcher matcher = pattern.matcher(pageContent);
        while (matcher.find()) {
            String imageUrl = matcher.group(1) == null ? "" : matcher.group(1);
            String imgDesc = matcher.group(2) == null ? "" : matcher.group(2);
            if (!TextUtils.isEmpty(imageUrl)) {
                result.add(new Pair<String, String>(SAMLIB_URL_PREFIX + imageUrl.trim(), imgDesc.trim()));
            }
        }
        return result;
    }
}